Variables y tipos

R para Ciencia de Datos en Salud:
Análisis Descriptivo e Inferencia Estadística

Percy Soto-Becerra M.D., M.Sc(c)

InkaStats Data Science Solutions | Medical Branch
@github/psotob91

Variables

Variable


Es toda característica que se desea observa, medir o evaluar en las unidades de estudio.

  • Se pueden clasificar de varias formas.

  • Dos clasificaciones son importantes porque pueden tener implicancias estadísticas:

    • Basada en la naturaleza de la variable

    • Basada en su escala o nivel de medición

Tipos de variables

De acuerdo a su naturaleza
Variables
Tipos
Numéricas
Categóricas
Continuas
Discretas
Politómicas o Multinomiales
Dicotómica o Binaria

Variables numéricas


  • Son aquellas cuyos valores pueden ser expresados en forma numérica.

  • También llamadas cuantitativas.

  • Pueden ser continuas o discretas

Continuas

  • Son aquellas que pueden tomar un número infinito no numerable de valores posibles.
  • Por lo general pueden obtenerse mediante la aplicación de instrumentos de medición.
  • Ejemplos: Peso, talla, hemoglobina, etc.

Discretas

  • Son aquellas que tienen un número finito o infinito numerable de valores posibles.
  • Por lo general pueden obtenerse mediante conteo.
  • Número de casos COVID-19, número de camas, etc.

Variables categóricas


  • Son aquellas que proporcionan datos expresados como categorías.

  • También llamadas cualitativas.

  • Pueden ser dicotómicas o politómicas.

Dicotómicas o binarias

  • Son aquellas que solo pueden asumir dos valores.
  • Como son dos valores, el orden no es un asunto importante, incluso si se pudiera establecer una jerarquía.
  • Ejemplos: Diagnóstico de diabetes, muerte, etc.

Politómicas o multinomiales

  • Son aquellas que asumen 3 o más valores.
  • Puede haber o no una relación de jerarquía u orden.
  • Ejemplos: Nivel de dolor, tipo de establecimiento de salud, etc.

Niveles de medición

Niveles de medición


Nivel Características Ejemplo
Nominal Solo distingue nombres. Tratamiento recibido, color de ojos, de cabello, etc.
Ordinal Distingue nombres y orden. Nivel de dolor
Intervalo Distingue nombres, orden y proporciona 'intervalo' de diferencia entre valores. Temperatura en grados Celsius
Esto implica que cero sea relativo: No indica ausencia, si no que es arbitrario.
La razón o división no tiene sentido, la resta sí.
Razón Distingue nombre, orden, proporciona 'intervalo' de diferencia entre valores y el cero es absoluto. Peso, talla, etc.
Esto implica que la diferencia y la razón tienen sentido.

Tipos de variables y niveles de medición


  • A continuación algunos ejemplos de cómo se relaciona el tipo de variable y el nivel de medición de esta:
Tipo Nominal Ordinal Intervalo Razón
Dicotómicas Diabetes(tiene vs. no tiene) No aplica No aplica No aplica
Politómicas Tipo de Establecimiento de Salud (MINSA vs. EsSalud vs. FFAA/PNP vs. Privado) Nivel de dolor (Leve, Moderado, Severo) No aplica No aplica
Discretas No aplica Escala de valoración numérica de dolor Coeficiente intelectual (debate) Número de casos COVID-19
Continuas No aplica Escala visual analógica de dolor Temperatura en ºC Hemoglobina en mg/dL

¿Pueden las variables numéricas ser de escala ordinal?

  • ¡Claro que sí!

  • Son numéricas porque expresamos números para representarlas.

  • El orden de estos números importa, sin embargo, no siempre esto alcanza para ser al menos escala de intervalo o razón.

¿Qué se requiere para ser intervalo o razón?

  • Se llama intervalo porque si tomo dos valores cualesquiera y formo un intervalo y luego tomo otro intervalo del mismo tamaño, pero conformado por dos valores diferentes, ambos intervalos valen objetiva y consistentemente lo mismo.

  • Ejemplo:

    • Si Pepe pesa 45 kg y Rosa pesa 50 kg, la diferencia del peso es 5 kg.

    • Si Juan pesa 49 kg y María pesa 54 kg, la diferencia también es de 5 kg.

    • Objetivamente hablando, ambas diferencias de 5 kg son exactamente iguales.

    • 5 kg es una métrica física basada en un estándar que es la misma a donde vayas. Por eso, el peso es una variable que cumple los criterios de variable de intervalo.

    • Además, es de razón porque su cero es absoluto.

Variables numéricas medidas en escala ordinal

  • Nominal: Duele vs. No duele

  • Ordinal:

    • Politómico: Escala de intensidad visual del dolor (Visual Pain Intensity Scale) o “FACES” Scale

      • No dolor, Leve, …, El peor dolor posible
    • Numérica discreta: Escala de valoración numérica de dolor (Numerical Rating Scale / Numerical Pain Intensity Scale)

      • Puntua del 0 al 10 (solo números enteros).
    • Numérica continua: Escala visual analógica (Visual Analogue Scale)

      • Elige un punto en una recta horizontal.
      • Luego mide con una regla en cm (esto permite decimales).




  • Pepe puntua 1 y Rosa puntúa 3:

    • La diferencia entre ellos es de 2 puntos.
  • Juan puntúa 8 y María puntúa 10:

    • La diferencia entre ellos también es de 2 puntos.

  • ¿Estas diferencias, ambas de 2 puntos, son iguales? ¿Qué es un punto de dolor desde la perspectiva física, concreta, objetivable?

    • Estos 2 puntos pueden significar cosas diferentes dependiendo de la subjetividad de Pepe, Rosa, Juan y María.
  • Por eso, aunque se midan en números, su diferencia o intervalo no significan consistentemente lo mismo. La escala visual analógica y la escalade rating numérico son variables numéricas medidas en escala ordinal, no de intervalo.

Nuestro turno


  • Descargue la carpeta comprimida variables_tipos y descomprímala.

  • Abra el archivo quarto variable_tipos.qmd y responda las preguntas.

  • Compile el archivo quarto.




05:00